智能论文笔记

Robust Perception through Equivariance

Chengzhi Mao , Lingyu Zhang , Abhishek Joshi , Junfeng Yang , Hao Wang , Carl Vondrick

分类：计算机视觉

2022-12-12

Deep networks for computer vision are not reliable when they encounter adversarial examples. In this paper, we introduce a framework that uses the dense intrinsic constraints in natural images to robustify inference. By introducing constraints at inference time, we can shift the burden of robustness from training to the inference algorithm, thereby allowing the model to adjust dynamically to each individual image's unique and potentially novel characteristics at inference time. Among different constraints, we find that equivariance-based constraints are most effective, because they allow dense constraints in the feature space without overly constraining the representation at a fine-grained level. Our theoretical results validate the importance of having such dense constraints at inference time. Our empirical experiments show that restoring feature equivariance at inference time defends against worst-case adversarial perturbations. The method obtains improved adversarial robustness on four datasets (ImageNet, Cityscapes, PASCAL VOC, and MS-COCO) on image recognition, semantic segmentation, and instance segmentation tasks. Project page is available at equi4robust.cs.columbia.edu.

translated by 谷歌翻译

Forged Image Detection using SOTA Image Classification Deep Learning Methods for Image Forensics with Error Level Analysis

Raunak Joshi , Abhishek Gupta , Nandan Kanvinde , Pandharinath Ghonge

分类：计算机视觉 | 机器学习

2022-11-28

The advancement in the area of computer vision has been brought using deep learning mechanisms. Image Forensics is one of the major areas of computer vision application. Forgery of images is sub-category of image forensics and can be detected using Error Level Analysis. Using such images as an input, this can turn out to be a binary classification problem which can be leveraged using variations of convolutional neural networks. In this paper we perform transfer learning with state-of-the-art image classification models over error level analysis induced CASIA ITDE v.2 dataset. The algorithms used are VGG-19, Inception-V3, ResNet-152-V2, XceptionNet and EfficientNet-V2L with their respective methodologies and results.

translated by 谷歌翻译

A Review of Challenges in Machine Learning based Automated Hate Speech Detection

Abhishek Velankar , Hrushikesh Patil , Raviraj Joshi

分类：自然语言处理 | 机器学习

2022-09-12

仇恨言论在社交媒体领域的传播目前是一个严重的问题。对这些平台上生成的大量信息的不符合访问导致人们发布和反应发起暴力的有毒内容。尽管已经努力在线检测和限制此类内容，但准确识别它仍然具有挑战性。基于深度学习的解决方案一直处于识别可恶内容的最前沿。但是，诸如仇恨言论的上下文依赖性，用户的意图，不希望的偏见等因素使这个过程过度批评。在这项工作中，我们通过提出这些问题的层次结构组织来深入探索自动仇恨言论检测的广泛挑战。我们专注于机器学习或基于深度学习的解决方案所面临的挑战。在最高级别，我们将数据级别，模型级别和人类级别的挑战区分开。我们进一步提供了详细的分析层次结构的示例。这项调查将帮助研究人员在仇恨言论检测领域更有效地设计其解决方案。

translated by 谷歌翻译

Metric Effects based on Fluctuations in values of k in Nearest Neighbor Regressor

Abhishek Gupta , Raunak Joshi , Nandan Kanvinde , Pinky Gerela , Ronald Melwin Laban

分类：机器学习

2022-08-24

机器学习的回归分支纯粹集中于连续值的预测。监督学习分支具有许多基于回归的方法，具有参数和非参数学习模型。在本文中，我们旨在针对与基于距离的回归模型相关的非常微妙的点。所使用的基于距离的模型是K-Nearest邻居回归器，它是一种监督的非参数方法。我们要证明的观点是模型的k参数的效果及其影响指标的波动。我们使用的指标是根平方误差和R平方拟合的优点，其值相对于K值的值表示。

translated by 谷歌翻译

Semantic Driven Energy based Out-of-Distribution Detection

Abhishek Joshi , Sathish Chalasani , Kiran Nanjunda Iyer

分类：计算机视觉

2022-08-23

在现实世界中的视觉应用中检测分布（OOD）样本（例如分类或对象检测）已成为当今深度学习系统部署的必要前提。已经提出了许多技术，其中已证明基于能量的OOD方法是有希望和令人印象深刻的性能。我们提出了基于语义驱动的能量方法，这是一种端到端的可训练系统，易于优化。我们将分布样品与能量评分和表示分数结合的外部分布样品区分开。我们通过最大程度地降低分布样品的能量来实现这一目标，并同时学习各自的类表征，这些类别更接近和最大化能量以供外分发样品，并将其从已知的类表征进一步推出。此外，我们提出了一种新颖的损失功能，我们称之为群集局灶性损失（CFL），事实证明这很简单，但在学习更好的班级群集中心表示方面非常有效。我们发现，我们的新方法可以增强异常检测，并在共同基准上获得基于能量的模型。与现有基于能量的方法相比，在CIFAR-10和CIFAR-100训练的WideSnet上，我们的模型分别将相对平均假正（以95％的真实正率为95％）降低67.2％和57.4％。此外，我们扩展了对象检测的框架并提高了性能。

translated by 谷歌翻译

Prediction of Maneuvering Status for Aerial Vehicles using Supervised Learning Methods

Abhishek Gupta , Sarvesh Thustu , Riti Thakor , Saniya Patil , Raunak Joshi , Ronald Melvin Laban

分类：机器人 | 机器学习

2022-06-02

航空车遵循基于纬度，经度和高度的引导方法。该信息可用于计算沿轨迹线的机动车辆的机动状态。这是一个二进制分类问题，可以利用机器学习来解决此类问题。在本文中，我们提出了一种使用线性，距离度量，判别分析和增强合奏监督学习方法来得出机动状态及其预测的方法。我们在结果部分中沿行沿线提供各种指标，从而对适当的算法进行了简短的比较，以预测操纵状态。

translated by 谷歌翻译

Universal Caching

Ativ Joshi , Abhishek Sinha

分类：机器学习

2022-05-10

在学习理论中，通常根据静态遗憾度量来衡量在线政策的表现，该指标将在线政策的累积损失与事后看来的最佳基准的累积损失进行了比较。在静态遗憾的定义中，基准策略的行动在整个时间范围内保持固定。自然地，在固定行动通常遭受性能不佳的非统计环境中，产生的遗憾界限变得松散。在本文中，我们调查了在线缓存中更强烈的遗憾最小化概念。特别是，我们允许任何一轮基准的行动由包含任何数量状态的有限状态机决定。流行的缓存政策，例如LRU和FIFO，属于此类。利用信息理论中普遍预测文献中的思想，我们提出了一个有效的在线缓存政策，并具有次线性遗憾。据我们所知，这是在通用环境中以缓存问题而闻名的第一个依赖数据的遗憾。我们通过将最近提供的在线缓存政策与逐步解析算法（即Lempel-Ziv '78）相结合来确定这一结果。我们的方法还产生了更简单的学习理论证明，证明了与早期作品中使用的涉及特定问题的组合论证相反，遗憾的改善。

translated by 谷歌翻译

Discriminant Analysis in Contrasting Dimensions for Polycystic Ovary Syndrome Prognostication

Abhishek Gupta , Himanshu Soni , Raunak Joshi , Ronald Melwin Laban

分类：机器学习

2022-01-09

已经配制了许多预后方法，用于早期发现使用机器学习的PCOS的多囊卵巢综合征。PCOS是二进制分类问题。减少方法对机器学习的性能变得更大，并且使用监督的维度减少方法可以给我们一个新的边缘来解决这个问题。在本文中，我们将不同尺寸的判别分析与线性和二次形式进行不同尺寸，以及二进制分类以及度量。与许多常用的分类算法相比，我们能够达到良好的准确性和判别分析的变化，并且使用二次判别分析达到95.92％的95.92％的测试精度。纸张还提供了具有可视化的数据，以便更深入地了解问题。

translated by 谷歌翻译

Succinct Differentiation of Disparate Boosting Ensemble Learning Methods for Prognostication of Polycystic Ovary Syndrome Diagnosis

Abhishek Gupta , Sannidhi Shetty , Raunak Joshi , Ronald Melwin Laban

分类：机器学习

2022-01-02

利用恒星精度利用机器学习技术使用临床资料的预后，是目前最重要的真实世界挑战之一。考虑到又称PCOS的多囊卵巢综合征的医学问题是15至49岁的女性的新出现问题。通过使用各种升压集合方法诊断这种疾病是我们本文提出的。自适应提升，渐变升压机，XGBoost和Catboost之间的详细和简化差异，具有各自的性能指标突出显示数据中的隐藏异常及其对结果的影响是我们在本文中提出的。本文已经使用了混淆矩阵，精度，召回，F1得分，FPR，ROC曲线和AUC等度量。

translated by 谷歌翻译

Hate and Offensive Speech Detection in Hindi and Marathi

Abhishek Velankar , Hrushikesh Patil , Amol Gore , Shubham Salunke , Raviraj Joshi

分类：自然语言处理 | 机器学习

2021-10-23

情绪分析是最基本的NLP任务，用于确定文本数据的极性。在多语言文本领域也有很多工作。仍然讨厌和令人反感的语音检测面临着挑战，这是由于数据的可用性不足，特别是印度和马拉地赛等印度语言。在这项工作中，我们考虑了印地语和马拉地养文本的仇恨和令人反感的语音检测。使用艺术的深度学习方法的状态制定了该问题作为文本分类任务。我们探讨了CNN，LSTM等不同的深度学习架构，以及多语言伯爵，烟草和单晶罗伯塔等伯特的变化。基于CNN和LSTM的基本模型将使用快文文本嵌入式增强。我们使用HASOC 2021 HINDI和MARATHI讨论语音数据集来比较这些算法。 Marathi DataSet由二进制标签和后印度数据集组成，包括二进制和更精细的粗糙标签。我们表明，基于变压器的模型表现了最佳甚至基本型号以及FastText Embeddings的基本模型具有竞争性能。此外，通过普通的超参数调谐，基本模型比细粒度的Hindi数据集上的基于BERT的模型更好。

translated by 谷歌翻译